python urlopen函数

python2.x中urllib2库在python 3.x 中为urllib.request

urlopen()函数即创建一个类文件对象为指定的 url 来读取。

1
2
3
4
5
6
7
>>> help(urllib.urlopen)

Help on function urlopen in module urllib:

urlopen(url, data=None, proxies=None)

    Create a file-like object for the specified URL to read from.

详细点就是,创建一个表示远程url的类文件对象,然后像本地文件一样操作这个类文件对象来获取远程数据。参数url表示远程数据的路径,一般是网址;参数data表示以post方式提交到url的数据,参数proxies用于设置代理

urlopen返回 一个类文件对象,他提供了如下方法:

  • 参数 url 表示远程数据的路径,一般是 http 或者 ftp 路径。

  • 参数 data 表示以 get 或者 post 方式提交到 url 的数据。

  • 参数 proxies 表示用于代理的设置。

urlopen 返回一个类文件对象,它提供了如下方法:

  • read() , readline() , readlines(),fileno()和close(): 这些方法的使用与文件对象完全一样。

  • info():返回一个httplib.HTTPMessage 对象,表示远程服务器返回的头信息。

  • getcode():返回Http状态码,如果是http请求,200表示请求成功完成;404表示网址未找到。

  • geturl():返回请求的url地址。

google = urllib.urlopen(‘http://www.google.com')

print ‘http header:/n’, google.info()

print ‘http status:’, google.getcode()

print ‘url:’, google.geturl()

for line in google: # 就像在操作本地文件

print line,  

google.close()